草庐IT

MySQL ORDER BY 多列 ASC 和 DESC

全部标签

python - Pandas groupby 结果分为多列

我有一个数据框,我希望在其中对组内的值进行分组,然后将其划分为多个列。例如:假设我有以下数据框:>>>importpandasaspd>>>importnumpyasnp>>>df=pd.DataFrame()>>>df['Group']=['A','C','B','A','C','C']>>>df['ID']=[1,2,3,4,5,6]>>>df['Value']=np.random.randint(1,100,6)>>>dfGroupIDValue0A1661C222B3983A4904C5855C638>>>我想对“组”字段进行分组,获取“值”字段的总和,并获取新字段,每个字段都

python - Pandas:根据多列值删除行

我有一个包含A,B,C列的数据框。我有一个元组列表,例如[(x1,y1),(x2,y2),...]。我想删除所有满足以下条件的行:(B=x1&&C=y1)|(B=x2&&C=y2)|...我怎样才能在Pandas中做到这一点?我想使用isin函数,但不确定是否可行,因为我的列表有元组。我可以这样做:forx,yintuples:df=df.drop(df[df.B==x&&df.C==y].index)也许有更简单的方法。 最佳答案 使用Pandas索引df.set_index(list('BC')).drop(tuples,err

python - 如何在 pandas groupby 中聚合多列

我使用以下输入创建了一个pandas数据框mn:keyAstaten1n2d1d2key1CA100100012key2FL200200024key1CA300300036key1AL400400048key2FL500500052key1NY600600064key2CA700700076创建了一个sum对象如下:s=mn.groupby(['keyA','state'],as_index=False).sum()如何迭代总和对象s,以便获得以下输出:下面结果中的v1列计算为s['n1']/s['d1']下面结果中的v2列计算为s['n2']/s['d2']keyAstatev1v2

python - 如何通过多列中的唯一索引在 Pandas 中求和?

我有一个pandasDataFrame,它详细说明了用户session期间“点击”方面的在线事件。有多达50,000个独立用户,数据框有大约150万个样本。显然大多数用户都有多个记录。四列分别是唯一的用户id、用户开始服务的日期“Registration”、用户使用服务的日期“Session”、总点击次数。DataFrame的组织结构如下:User_IDRegistrationSessionclicks23498762012-02-222014-04-24219872932011-02-012013-05-03122342142012-07-222014-01-227987445220

python - 如何一次将函数应用于 Pandas 数据框中的多列

我经常处理格式不正确的数据(即数字字段不一致等)可能还有其他我不知道的方法,但我在数据框中格式化单个列的方法是使用一个函数并将该列映射到该函数。format=df.column_name.map(format_number)问题:1-如果我有一个包含50列的数据框,并且想将该格式应用于多列,等等第1、3、5、7、9列,该怎么办你能走吗:format=df.1,3,5,9.map(format_number)..这样我就可以在一行中格式化我所有的数字列吗? 最佳答案 您可以执行df[['Col1','Col2','Col3']].ap

Python多列表迭代

有没有一种聪明的方法可以在Python中迭代两个列表(不使用列表理解)?我的意思是,像这样:#(a,b)isthecartesianproductbetweenthetwolists'elementsfora,binlist1,list2:foo(a,b)代替:forainlist1:forbinlist2:foo(a,b) 最佳答案 itertools.product()正是这样做的:fora,binitertools.product(list1,list2):foo(a,b)它可以处理任意数量的迭代器,从这个意义上说,它比嵌套的

python - Django 模型 : add index on date, desc 顺序

我正在尝试让Django模型按降序(DESC)顺序在日期字段上为我创建一个索引,但我找不到实现它的方法。基本上,我需要执行类似以下SQL的操作(在Posgres中):CREATEINDEX"idx_name"ON"table"("date"DESC);我能得到的最接近的方法是将db_index=True添加到生成以下SQL的模型中:CREATEINDEX"idx_name"ON"table"("date");接近,但不完全是。DESC在这里有很大的不同,因为我的查询返回了从最新到最旧的对象。我知道我可以将原始sql添加到迁移中,但如果Django能帮我弄清楚就更好了。有什么想法吗?谢谢

python - Pandas :使用数据框的多列作为另一个的索引

我有一个包含我的数据的大型数据框,以及另一个具有相同第一维度的数据框,其中包含有关每个时间点的元数据(例如,它是什么试验编号,它是什么试验类型)。我想要做的是使用“元数据帧”的值对大型数据帧进行切片。我想将它们分开(而不是将元数据帧存储为较大的多索引)。现在,我正在尝试做这样的事情:defmy_func(container):container.big_df.set_index(container.meta_df[['col1','col2']])container.big_df.loc['col1val','col2val'].plot()但是,这会返回以下错误:ValueError

python - 将 Pandas 单元格中的列表拆分为多列

这个问题在这里已经有了答案:Split/Explodeacolumnofdictionariesintoseparatecolumnswithpandas(13个答案)关闭3年前。我有一个非常简单的Pandasdataframe,其中每个单元格都包含一个列表。我想将列表的每个元素拆分到它自己的列中。我可以通过导出值然后创建新的dataframe来做到这一点。这似乎不是执行此操作的好方法,尤其是当我的dataframe在列表列之外还有一列时。importpandasaspddf=pd.DataFrame(data=[[[8,10,12]],[[7,9,11]]])df=pd.DataFr

python - Pandas:如何删除以 nan 作为列名的多列?

根据标题,这是一个可重现的示例:raw_data={'x':['this','that','this','that','this'],np.nan:[np.nan,np.nan,np.nan,np.nan,np.nan],'y':[np.nan,np.nan,np.nan,np.nan,np.nan],np.nan:[np.nan,np.nan,np.nan,np.nan,np.nan]}df=pd.DataFrame(raw_data,columns=['x',np.nan,'y',np.nan])dfxNaNyNaN0thisNaNNaNNaN1thatNaNNaNNaN2this